3 research outputs found

    Modified Random Forest For Handling Imbalanced Class in Customer Churn Prediction (Case Study: Telecommunication Industry)

    Get PDF
    Perkembangan industri telekomunikasi saat ini ,menghasilkan persaingan yang sangat ketat antara penyedia layanan (service provider). Persaingan ini mengakibatkan Customer Churn menjadi salah satu permasalahan yang sering dihadapi, karena dapat mempengaruhi pendapatan perusahaan, profitabilitas, kelangsungan hidup serta kualitas pelayanan perusahaan . Oleh karena itu, mengetahui pelanggan yang akan melakukan churn dikemudian hari (Customer churn prediction) secara dini menjadi salah satu cara yang sering dilakukan, karena dapat membantu perusahaan dalam membuat rencana yang efektif untuk tetap mempertahankan pelanggannya. Teknik klasifikasi data mining dapat digunakan untuk customer churn prediksi. Random forest merupakan salah satu teknik klasifikasi yang dikenal memiki kinerja sangat baik jika dibandingkan dengan teknik klasifikasi lainnya, karena sangat mudah digunakan dan memberikan performansi akurasi yang lebih tinggi. Namun algoritma klasifikasi tidak dapat berjalan dengan baik jika dihadapkan pada data yang tidak seimbang karena dapat mempengaruhi kinerja teknik klasifikasi serta performansi yang dihasilkan. Sedangkan data Customer Churn salah satu data yang memiliki karakteristik data yang tidak seimbang, dimana memiliki salah satu class data yang sedikit dari pada class data lainnya. Tujuan dari penelitian ini adalah menanggani data imbalance pada Customer Churn Prediction untuk meningkatkan efektivitas teknik klasifikasi dalam menghasilkan performansi prediksi yang lebih baik. Oleh karena itu dalam penelitian ini dilakukan klasifikasi pada data Customer churn PT Telekomunikasi Indonesia dengan mengusulkan sebuah metode yang dinamakan Modified Balance Random Forest (MBRF). Proses MBRF melakukan perubahan proses Balance Random Forest dengan menerapkan strategi undersampling berdasarkan clustering untuk setiap boostrap data yang akan dijadikan dalam pembentukan setiap pohon keputusan pada random forest, oleh sebab itu pendekatan MBRF disebut juga pendekatan handling imbalance data berdasarkan algoritma. Metode yang diuslkan pada penelitian ini (MBRF) memberikan hasil performansi yang lebih baik jika dibandingkan dengan metode Balance Random Forest (BRF) dan Random Forest (RF). MBRF memberikan nilai akurasi AUC terbaik (91.65%), Sensitivity atau True Positve Rate (TPR) terbaik (88%), Specificity atau True Negative Rate (TNR) terbaik (94%), dan G-Means terabaik (91%). Selain memberikan performansi yang lebih baik, MBRF juga memperbaiki jumlah waktu running time dengan menghasilkan time consumption proses yang lebih rendah

    Modified balanced random forest for improving imbalanced data prediction

    Get PDF
    This paper proposes a Modified Balanced Random Forest (MBRF) algorithm as a classification technique to address imbalanced data. The MBRF process changes the process in a Balanced Random Forest by applying an under-sampling strategy based on clustering techniques for each data bootstrap decision tree in the Random Forest algorithm. To find the optimal performance of our proposed method compared with four clustering techniques, like: K-MEANS, Spectral Clustering, Agglomerative Clustering, and Ward Hierarchical Clustering. The experimental result show the Ward Hierarchical Clustering Technique achieved optimal performance, also the proposed MBRF method yielded better performance compared to the Balanced Random Forest (BRF) and Random Forest (RF) algorithms, with a sensitivity value or true positive rate (TPR) of 93.42%, a specificity or true negative rate (TNR) of 93.60%, and the best AUC accuracy value of 93.51%. Moreover, MBRF also reduced process running time

    Implementasi Algoritma Weighted Moving Average pada Fuzzy Evolutionary Algorithm (Fuzzy EAs) untuk Peramalan Kalender Masa Tanam Berbasis Curah Hujan

    Get PDF
    Peramalan merupakan proses memperkirakan sesuatu secara sistematis berdasarkan keadaan atau fakta sebelumnya. Peramalan bisa dilakukan melalui serangkaian metode ilmiah atau dengan subjektif belaka. Soft computing (SC) merupakan salah satu metode ilmiah yang dapat digunakan untuk kasus peramalan atau prediksi. Soft Computing (SC) memiliki algoritma dasar yakni Fuzzy System, Artificial Neural Network (ANN), dan Evolutionary Alghorithms (EAs). Pada Tugas akhir ini dilakukan penelitian mengenai peramalan kalender masa tanam dari tanaman jagung yang berbasis curah hujan di wilayah Soreang, Kabupaten Bandung dengan menggunakan salah satu jenis Algoritma dasar Soft computing (SC) yakni Evolutionary Alghorithms (EAs). Data yang digunakan adalah data curah hujan wilayah Soreang Kabupaten Bandung selama 10 tahun terakhir (2006-2015). Data ini akan melalui preprocessing terlebih dahulu dengan Weighted Moving Average (WMA). Selanjutnya, untuk proses Evolutionary Alghorithms (EAs) dimulai dari sekumpulan kandidat solusi (individu) yang disebut populasi, dimana satu individu menyatakan satu solusi. Populasi awal akan ber- evolusi menjadi sebuah populasi baru melalui serangkaian generasi (iterasi), pada akhir generasi EAs mengembalikan individu anggota populasi yang terbaik sebagai solusi untuk masalah yang dihadapi. Pada representasi individu, EAs memiliki empat algoritma yang bisa digunakan, salah satunya Grammatical Evolution (GE) yang akan digunakan pada penelitian ini. Selanjutnya, dalam tugas akhir ini digunakan logika Fuzzy untuk pengoptimasian GE, dengan cara mendefinisikan beberapa parameter pada awal running , agar proses dapat berjalan dengan baik. Hasil akhir yang didapat menunjukkan bahwa logika Fuzzy membantu meningkatkan performansi EAs dan Fuzzy EAs menghasilkan performansi peramalan kalender masa tanam sebesar 76,93 %. Hasil peramalan akan digunakan untuk pembuatan kalender masa tanam di Kabupaten Bandung selama 13 (tiga belas) bulan yang dimulai pada Oktober 2014 sampai dengan Oktober 2015. **Kata Kunci** : peramalan, curah hujan, *weighted moving average*, fuzzy (EAs), kalender masa tanam
    corecore